AI搜索:多模态最强,但创新有限 AI搜索可以说是谷歌的必争之地。面对着来势汹汹,号称要取代谷歌搜索的新秀Perplexity们,谷歌就算不用AI,也得留着后者。从去年一年来看,新兴的AI搜索虽然获得了不少用户,但基本上没有动摇到谷歌搜索的根基。所以谷歌也是一副不紧不慢的样子:它的AI搜索服务ESG从去年五月到现在,整整公布一年时间后总算从今天起向公众开放使用了。这个更强的AI搜索引擎被谷歌命名为AI Overview,但仅限美国,其他国家还得排队等着开。从Demo展示来看,谷歌搜索在功能上的创新不算多,主要集中在多模态。首先,用户将能够通过简化语言或更详细地分解来调整 AI 搜索结果概述。这个功能并不新,现在主流的AI搜索产品也会区分快捷回复和更深入的研究模式。其次,借助 Gemini 的多步推理能力,AI 搜索可以一次性处理复杂的多步,乃至多问题。比如说,当用户寻找一个新的瑜伽或普拉提工作室,用户希望找到受当地人欢迎,方便用户的通勤,并且还提供新会员折扣的选项。通过谷歌AI搜索,用户将能够通过一次搜索询问类似“查找波士顿最好的瑜伽或普拉提工作室,并显示其入门优惠和从 Beacon Hill 步行时间的详细信息”的问题得到最佳答案。这也是其他AI搜索产品现在在努力攻破的一个方向。谷歌在这方面凭借着模型优势很可能会处理的更好。同样构建在多步推理能力之上的是AI搜索的计划能力。通过AI搜索中的计划功能,你可以直接在搜索里获得一个完整的计划。比如搜索类似“为一群人创建一个易于准备的三天餐饮计划”,您将获得一个起点,包含来自网络各处的各种食谱。这是其他搜索软件暂时还没有专精的能力。但是对于可联网的ChatGPT来说,这应该不是难事。当然谷歌搜索组织的更漂亮,还可以直接连接,用户体验更优。
GPT-4o生成的版本
谷歌生成的版本最后是灵感延展功能,就是AI搜索在创建一个 AI 组织的结果页面,使您更容易探索。在问了一个问题后,谷歌搜索将会延展到其他可能你感兴趣的结果,按独特的 AI 生成标题分类,展示广泛的视角和内容类型。这种联想搜索能力也已经是AI搜索的某种标配了,但谷歌对这个功能做了更好的结构化。以上的功能,其他的AI搜索都能做,但谷歌的结构化和界面做的最好。也仅此而已。最后其他AI搜索暂时做不到的是多模态搜索。靠Gemini的多模态功能,谷歌可以做到利用声音搜歌曲,利用图片搜产品。甚至可以用Circle to Secarch 功能圈出图片中的一部分去搜索。AI还能结合视频进行搜索。谷歌举了个范例,比如用户在旧货店买了一台唱片机,但打开时无法工作,带有针头的金属部件在意外漂移。用视频搜索能节省了用户找到合适词语来描述这个问题的时间和麻烦。
模型产品可以说是最让人失望的环节。新意全无,还多少让人看出谷歌的保守态势。首先登场的是结合Gemini的Wrokspace。你可以通过 Side Panel(一个能唤起Gemini的侧边栏)功能总结一系列邮件,可以总结你的账单,形成一个Sheet。OK,去年看过了。自动回复邮件。去年看过了。每个都进行了小的升级,比如回复邮件可以从确认,回绝,搁置三种可能中选了。但……现场都掌声寥寥。